Search results for "stimulētā mācīšanās"
showing 5 items of 5 documents
POMDP problēmu risināšana, izmantojot vēsturiskus elementus, un tās optimizācija
2017
Elvja Egles Bakalaura darba „POMDP problēmu risināšana, izmantojot vēsturiskus elementus, un tās optimizācija” ietvaros tika izpētīti daļēji novērojami Markova lēmuma procesu (POMDP) algoritmi. Balstoties uz Jāņa Zutera zinātniski pētniecisko raksta saturu „Sequence Q-Learning: a Memory-based Method Towards Solving POMDP”, kurā ir aprakstīta POMDP risināšanas ideja, tika izstrādāts līdzvērtīgs mašīnmācīšanās algoritms, saskaņā ar rakstā sniegto informāciju. Bakalaura darba ietvaros tika pētīta šī Algoritma efektivitāte, kā arī apskatītas un piedāvātas vairākas iespējas tā tālākai pilnveidei. Programmētais darbs tika pievērsts konkrētai problēmai, kurai bija novērojama labāka ātrdarbība ar n…
Paredzošā stimulētā mācīšanās
2016
Continuous actor-critic learning automaton, jeb CACLA, algoritma aktiera un kritiķa komponentes ir apvienojamas vienā, izmantojot faktu, ka tās no stāvokļu telpas izgūst līdzīgas pazīmes savu funkciju veikšanai. Tas ļauj divas reizes samazināt to realizēšanā izmantotā neironu tīkla trenējamo parametru skaitu, kā arī ļauj aģentam ātrāk nonāk pie labas stratēģijas, jo optimālās stratēģijas funkcijas parametri tiek pielāgoti arī vērtību funkcijas izmaiņu rezultātā. Tas noved pie savdabīga optimālās stratēģijas funkcijas parametru nepārraudzītās mācīšanās procesa. Šāds netiešā veidā veikts optimālās stratēģijas funkcijas parametru pielāgošanas process atstāj ietekmi uz trenēšanas procesu, jo sa…
Bezpilotu mašīnu apmācība izmantojot stimulētās mācīšanās dziļos neirona tīklus koorporatīvās braukšanas sistēmā
2017
Šajā darbā ir izstrādāta programmatūra un demonstrēts, kā radiovadāmu mašīnu var apmācīt braukt trasē, izmantojot tikai video attēlus un neironu tīklus. Virtuālajā vidē tiek pierādīts, ka ar šādu metodi, apmācot transportlīdzkli braukt pa vienu trasi, tas spēj izbraukt kārdināli atšķirīgu trasi, ko modelis nav redzējis. Padziļināti tiek pētīti darbi par saistītajām tehnoloģijām, stimulēto mācīšanos un pozicionēšanas sistēmām, lai varētu turpināt darbu pie sistēmu, kas ļautu transportlīdzeklim pašam mācīties braukt. Šī darba mērķis ir izstrādāt programmatūru, kuru būtu iespējams izmantot uz reālas pašbraucošas mašīnas Mazda 6, kas ir pieejama, sadarbojoties ar EDI. Neironu tīkli un īpaši sti…
Unity ML aģentu izmantošana vienkāršas ekosistēmas implementācijai
2018
Darba gaitā ar Unity ML tehnoloģijas palīdzību tiek izstrādāta programmatūra un demonstrēta vide, kas ļauj vienlaicīgi trenēt vairākus stimulētās mācīšanās aģentus, kur katram ir savi mērķi, dažādi vides novērojumi, uzvaras un zaudēšanas stāvokļi un kur katru kontrolē savs neironu tīkls. Tiek arī implementēta mācību stundu trenēšana, kur vide tiek sadalīta dažādās stadijās, lai optimizētu dažādu darbības aspektu iemācīšanos. Šī darba galvenie mērķi ir: •Demonstrēt, ka Unity ML tehnoloģija ir pietiekami laba, lai ar tās palīdzību iegūtos neironu tīklus varētu pielietot stimulētās mācīšanās uzdevumu risināšanai. •Izveidot spēli, kur ir vismaz divi spēlētāji ar dažādiem uzvaras stāvokļiem, un …
Dziļās stimulētās mācīšanās izmantošana industriālu robotu vadīšanā
2022
Dziļā stimulētā mācīšanās ir guvusi plašus panākumus dažādās jomās, kā, piemēram, videospēlēs un galda spēlēs. Robotikas kontroles jomā stimulētās mācīšanās algoritmi dod cerību, ka robotiem būs cilvēkam līdzīgas spējas – mācīties caur izmēģinājumiem un kļūdām. Šajā darbā tiks pētīta dziļās stimulētās mācīšanās pielietošana robotikas manipulācijām, kā arī tiks izveidota jauna dziļās stimulētās mācīšanās vide simulatorā “Ignition Gazebo”. Praktiskā uzdevuma mērķis ir izveidot unikālu, reālistisku stimulētas mācīšanās vidi dažādiem robotikas uzdevumiem, kas varētu tikt izmantota kā sākotnējs paraugs, sarežģītām reālās dzīves scenāriju simulācijas izveidei.